术语解释:
support:支持度,即某个商品组合在所有交易中出现的频率,比如10个人中有两个买过沙发,那么沙发支持度为0.2
confidence:信任度,即某个商品的条件概率,如果买了B的人中,有1四分之一买了A,那么A对于B的信任度是0.25
lift:提升,上面的条件概率除以A在整个交易中出现的频率,是最重要的关联指标
出现频率最高的商品品类前30,纵坐标是相对频率
我们可以看到按照lift排名前30的相关关系 {铝合金窗,暖通} => {安全门} lift = 24 表示购买铝合金窗和暖通的人购买安全门的概率是没有任何信息普通人的24倍
## lhs rhs support confidence lift
## [1] {铝合金窗,
## 暖通} => {安全门} 0.0001339232 0.2685185 24.732257
## [2] {安全门,
## 铝合金窗} => {暖通} 0.0001339232 0.2929293 23.200986
## [3] {安全门,
## 暖通} => {铝合金窗} 0.0001339232 0.2710280 21.043009
## [4] {暖通,
## 综合类瓷砖} => {安全门} 0.0001477773 0.1860465 17.136063
## [5] {安全门,
## 综合类瓷砖} => {暖通} 0.0001477773 0.2051282 16.246844
## [6] {铝合金窗,
## 综合类瓷砖} => {暖通} 0.0001293052 0.2043796 16.187549
## [7] {木门,
## 暖通} => {安全门} 0.0001108330 0.1463415 13.478976
## [8] {暖通,
## 综合类瓷砖} => {铝合金窗} 0.0001293052 0.1627907 12.639306
## [9] {橱柜,
## 铝合金窗} => {暖通} 0.0001108330 0.1558442 12.343382
## [10] {橱柜,
## 吊顶,
## 移门衣柜,
## 整体卫浴} => {木门} 0.0001015969 0.7096774 12.001169
## [11] {橱柜,
## 木门,
## 移门衣柜,
## 整体卫浴} => {吊顶} 0.0001015969 0.3666667 11.430857
## [12] {橱柜,
## 暖通} => {铝合金窗} 0.0001108330 0.1420118 11.026005
## [13] {木门,
## 移门衣柜,
## 整体卫浴} => {吊顶} 0.0002124299 0.3484848 10.864038
## [14] {安全门,
## 木门} => {暖通} 0.0001108330 0.1340782 10.619446
## [15] {木门,
## 暖通} => {铝合金窗} 0.0001015969 0.1341463 10.415316
## [16] {吊顶,
## 移门衣柜,
## 整体卫浴} => {木门} 0.0002124299 0.5411765 9.151694
## [17] {橱柜,
## 吊顶,
## 移门衣柜} => {木门} 0.0002262840 0.4949495 8.369961
## [18] {厨卫电器,
## 橱柜,
## 木门} => {综合类瓷砖} 0.0001015969 0.3793103 7.859964
## [19] {橱柜,
## 木门,
## 移门衣柜} => {吊顶} 0.0002262840 0.2512821 7.833734
## [20] {木门,
## 整体卫浴,
## 综合类瓷砖} => {吊顶} 0.0001385413 0.2459016 7.666000
## [21] {厨卫电器,
## 木门,
## 综合类瓷砖} => {橱柜} 0.0001015969 0.4782609 7.386318
## [22] {吊顶,
## 木门,
## 移门衣柜,
## 整体卫浴} => {橱柜} 0.0001015969 0.4782609 7.386318
## [23] {橱柜,
## 吊顶,
## 木门,
## 整体卫浴} => {移门衣柜} 0.0001015969 0.4888889 7.346123
## [24] {橱柜,
## 木门,
## 整体卫浴} => {吊顶} 0.0002078119 0.2319588 7.231329
## [25] {橱柜,
## 油漆涂料} => {吊顶} 0.0001200691 0.2280702 7.110102
## [26] {木门,
## 移门衣柜,
## 整体卫浴} => {橱柜} 0.0002770825 0.4545455 7.020054
## [27] {吊顶,
## 木门,
## 移门衣柜} => {橱柜} 0.0002262840 0.4495413 6.942769
## [28] {移门衣柜,
## 整体卫浴,
## 综合类瓷砖} => {木门} 0.0001477773 0.3855422 6.519803
## [29] {橱柜,
## 吊顶,
## 整体卫浴} => {木门} 0.0002078119 0.3846154 6.504130
## [30] {橱柜,
## 整体卫浴,
## 综合类瓷砖} => {吊顶} 0.0001154510 0.2066116 6.441129
这里可以看到三个统计量之间的关系,支持度为横轴,信任度为纵轴,颜色深度为提升率
这里是用矩阵来表示关联,横轴为关联左项,纵轴为关联右项,大小为支持度,颜色深度为提升值 注意:这里采用了k-means聚类方法把类似的物品进行了整合,故显示的不多
这里的横坐标是支持度,纵坐标是信任度,颜色表示项目数,总体来说,项目多则信任度高,项目少则支持度高
这里用图形展示了商品品类的关系,颜色越深,表示关联越强,图形越大,表示支持越高
交互图,把鼠标移到图上可以看到相应的关联规则的解释
字典,我们可以交互的检查各个关系
inspectDT(rules)
交互式作图还在编写中 即根据用户的输入来动态画图